خوشه بندی اسناد xml به منظور کشف دانش
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه گیلان - دانشکده فنی
- نویسنده علی مرادی لالمی
- استاد راهنما رضا ابراهیمی آتانی اسد الله شاه بهرامی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1392
چکیده
امروزه اطلاعات موجود بر روی وب به سرعت در حال افزایش است و حجم بسیار زیادی از این اطلاعات در قالب xml ارائه شده است. یکی از مزایای اصلی استفاده از xml، نمایش داده های غیر ساخت یافته است که قابلیت های بسیاری را در اختیار کاربران قرار می دهد. ویژگی غیر ساخت یافته بودن اطلاعات و انعطاف پذیری xml باعث همه گیر شدن استفاده از آن شده است. با توجه به رشد فزاینده ی تعداد اسناد xml، سازماندهی موثر این اسناد xml به منظور بازیابی اطلاعات مفید از آنها ضروری است. یک راه حل امکان پذیر، انجام خوشه بندی بر روی اسناد xml به منظور کشف دانش است که باعث ارتقای مدیریت موثر داده ها، بازیابی اطلاعات و پردازش پرس و جو ها می شود. با این حال، مسائل بسیاری در کشف دانش از این نوع مدارک نیمه ساخت یافته با توجه به ناهمگونی و بی نظمی ساختاری آنها به وجود می آیند. بسیاری از پژوهش های موجود بر روی تکنیک های خوشه بندی، فقط بر روی یکی از ویژگی های اسناد xml، یعنی ساختار و یا محتوای آنها و با توجه به مشکلات مقیاس پذیری و پیچیدگی و آن هم در محدوده زبان انگلیسی متمرکز هستند. در این پایان نامه پس از بررسی روش های موجود، روشی برای خوشه بندی اسناد فارسی xml مبتنی بر هر دو ویژگی ساختاری و محتوایی اسناد و با استفاده از الگوریتم بهینه سازی رقابت استعماری ارائه می شود. برای اثبات کارایی و دقت خوشه بندی روش پیشنهادی از معیارهای موجود بهره گرفته و این روش با نمونه های قبلی ارائه شده مقایسه می شود.
منابع مشابه
خوشه بندی اسناد xml با استفاده از جنبه های مختلف اسناد
به واسطه قالب نیمه ساختیافته و خاصیت خود توصیف بودن، xml به ابزاری مناسب جهت بازنمایی و تبادل داده روی وب تبدیل گشته و امکان مدل کردن انواع مختلفی از داده ها را فراهم کرده است. با توجه به گسترش روزافزون استفاده از اسناد xml روی وب و اهمیت سازماندهی این اسناد، مطالعه و بررسی این موضوع و ایجاد بهبود روش های خوشه بندی اسناد xml جهت استفاده موثرتر از آنها ضروری می نماید. یکی از مهمترین چالش های موج...
بسط پرس وجو با خوشه بندی اسناد شبه بازخورد با شباهت حساس به پرس وجو
بسط پرسوجو بهعنوان یکی از روشهای انطباق پرسوجو، اثربخشی جستجو را در بازیابی اطلاعات افزایش میدهد. بازخورد شبه مرتبط (PRF) روشی برای بسط پرسوجو است که فرض میکند اسناد رتبه بالا از نتایج اولیه مرتبط به موضوع پرسوجو هستند و کلمات بسط را از این اسناد انتخاب میکند. درحالیکه ممکن است اسناد نامرتبط به پرسوجو در اسناد رتبهبالا وجود داشته باشد. روشهایی برای انتخاب اسناد مرتبط و نادیده گرفتن...
متن کاملخوشه بندی مشتریان به منظور تدوین استراتژی تخفیف دهی ، مطالعه موردی شرکت کدبانو
در طی سال های گذشته تعامل شرکت ها با مشتریانشان به طور قابل توجهی تغییر کرده است به طوری که تداوم کسب و کار با مشتری تضمین بلند مدت ندارد. به همین دلیل برای موفقیت یک سازمان لازم است سازمان ها نیازهای مشتریان خود را به درستی درک کرده؛ خواسته های آنها را پیش بینی کنند و با مجهز شدن به این دانش، استراتژیها و برنامه های فروش و بازاریابی خود را بهبود بخشند. یکی از راه های شناخت مشتریان، از طریق خوش...
متن کاملخوشه بندی مفاهیم و رویدادهای نوپدید سازماندهی دانش
هدف: هدف از انجام این پژوهش، بررسی و مصورسازی ساختار فکری حوزه سازماندهی دانش در وبگاه علم در بازه زمانی 1900-2018 و خوشهبندی مفاهیم و رویدادهای نوپدید این قلمرو موضوعی است. روششناسی: پژوهش حاضر از نوع کاربردی است و به روش همواژگانی با رویکرد تحلیلی انجام شده است. به منظور انجام تحلیل همواژگانی، از خوشهبندی سلسلهمراتبی و مقیاس چندبُعدی استفاده ش...
متن کاملالگویابی دادههای لرزهیی با استفاده از خوشه بندی به منظور پیش بینی زلزله
زلزلهها همواره بهعنوان یکی از مخربترین بلایای طبیعی شناخته میشوند. به دلیل خسارتهای اقتصادی و تلفات جانی بسیار بالا، پیشبینی زلزله امری ضروری به نظر میرسد. در این نوشتار، تغییرات زمانی پارامتر $b$ از رابطهی گوتنبرگ ریشتر قبل از زلزلههایی با بزرگای $M_w=6.0$ و یا بالاتر از آن در ناحیهی جنوبی ایران، منطقهی قشم و اطراف آن مورد بررسی قرار گرفته است. از دو روش خوشهبندی K-Means و نقشه...
متن کاملخوشه بندی فراابتکاری اسناد فارسی اِکس اِم اِل مبتنی بر شباهت ساختاری و محتوایی
با توجه به رشد فزاینده ی تعداد اسناد xml، سازماندهی موثر این اسناد به منظور بازیابی اطلاعات مفید از آنها ضروری می باشد. یک راه حل امکان پذیر، انجام خوشه بندی بر روی اسناد xml به منظور کشف دانش است. مسئله کلیدی در خوشه بندی اسناد xml این است که چگونه می توان شباهت بین اسناد xml را اندازه گیری کرد. استفاده از روش های متداول خوشه بندی اسناد متنی که اطلاعات محتوایی را برای اندازه گیری شباهت سند بکا...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه گیلان - دانشکده فنی
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023